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PROCEDE DE CODAGE DE LA PAROLE A BAS DEBIT. 



_ Le procede consiste a regrouper (1 7) les parametres 
sur N trames consecutives pour former une super-trame, & 
effectuer une quantification vectorielle (18) des frequences 
de transition du voisement au cours de chaque super-trame, 
en ne transmettant sans degradation que les configurations 
les plus frequentes et en remplagant les configurations les 
moins frequentes par la configuration la plus proche en ter- 
me d'erreur absoiue parmi les plus frequentes, k coder le 
pitch (19) en ne. quantifiant scalairement qu'une seule va- 
leur du pitch pour chaque super-trame, a coder I'energie 
(20) en ne selectionnant qu'un nombre reduit de valeurs en 
regroupant ces valeurs en sous paquets quantifies par 
quantification vectorielle, a coder par quantification vecto- 
rielle (21) les parametres cfenveloppe spectrale en ne se- 
lectionnant qu'un nombre determine de filtres, les 
parametres non transmis etant reconstruits par interpolation 
ou extrapolation a partir des parametres des filtres transmis. 
Applications: vocodeurs. 
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La presente invention concerne un procede de codage de la 
parole. Elle s'applique notamment a la realisation de vocodeurs a tres bas 
debit, de I'ordre de 1 200 bits par seconde et mis en oeuvre par exemple 
5 dans les communications par satellite, la telephonie sur internet, les 
repondeurs statiques, les pageurs vocaux etc... 

L'objectif de ces vocodeurs est de permettre de reconstruire un 
signal qui soit le plus proche possible au sens de la perception par I'oreille 
humaine du signal de parole d'origine, en utilisant un debit binaire le plus 

10 faible possible. 

Pour atteindre cet objectif les vocodeurs utilisent un modele 
totalement parametre du signal de parole. Les parametres utilises 
concernent le voisement qui decrit le caractere periodique des sons 
voises ou le caractere aleatoire de sons non voises, la frequence 

1 5 f ondamentale des sons voises encore connue sous le vocable anglo-saxon 
"PITCH", ('evolution temporelle de I'energie ainsi que Tenveloppe 
spectrale du signal pour exciter et parametrer les filtres de synthese. 
Generalement le filtrage est realise" par une technique de filtrage 
numerique a prediction Iineaire. 

20 ces differents parametres sont estim<§s periodiquement sur le 

signal de parole, de une a plusieurs fois par trame de 10 a 30 ms, selon 
les parametres et les codeurs. Us sont elabores au niveau d'un dispositif 
d'analyse et sont generalement transmis a distance en direction d'un 

dispositif de synthese. 

25 Le domaine du codage de la parole a bas debit a longtemps ete 

domine par un codeur a 2 400 bits/s connu sous la designation LPC 10. 
Une description de ce codeur, ainsi que d'une variante a plus bas debit 
peut etre trouvee dans les articlesjntitules : 

"Parameters and coding characteristics that must be common 

30 to assure interoperability of 2 400 bps linear predictive encoded speech", 
NATO Standard STANAG - 4198 - Ed 1. 13 February 1984 et dans 
('article de MMTB.Mouy, D de laNoue et'G. Goudezeune, intitule "NATO 
STANAG 4479 : A standard for an 800 bps vocoder and -channel coding 
in HF-ECCM system", publie da'ris IEEE International Conference on 
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Acoustics, Speech, and Signal Processing, Detroit, May 1955, pp. 480- 
483. 

Bien que parfaitement intelligible, la parole reproduce par ce 
vocodeur, est d'assez mauvaise qualite, de sorte que son usage est limite 
5 a des applications bien sp6cifiques," principalement professionnelles et 
militaires. Ces dernidres ahn^es Te~^ domaine du codage de la parole a bas 
debit a connu un grand nombre d'innovations, grace & ('introduction de 
nouveaux modeles connus respectivement sous les abreviations MBE, 
PWI et MELP. 

10 Une description du module MBE peut etre trouv^e dans I'article 

de MM. D.W. Griffin and J.S. Lim, intitule "Multiband Excitation 
Vocoders", publie dans la revue IEEE Trans, on Acoustics, Speech, and 
Signal Processing, vol. 36, n°-8, pp. 1223-1235, 1988. 

Celle du modele PWI peut etre trouv6e dans Particle de MM. 

15 W.B. Kleijn and J. Haogen, intitule "Waveform Interpolation for Coding 
and Synthesis" dans la revue Speech Coding and Synthesis edite par 
W.B. Kleijn et KK. Paliwal, Elsevier 1995. 

Enfin, une description du modele MELP peut etre trouvee dans 
('article de MM. L.M. Supplee, R.P. Cohn, J.S. Collura, and A.V. McCree, 

20 intitule "MELP : The new federal standard at 2 400 bits/s, publie dans la 
revue IEEE International Conference on Acoustics, Speech, and Signal 
Processing, Munich, April 1997, pp. 1591 - 1594. 

La qualite de la parole restituee par ces modeles a 2400 bits/s 
est devenue acceptable pour un ngrand nombre d'applications civiles et 

25 commerciales. Mais pour les d6bits._inferieurs a 2 400 bits/s (typiquement 
1 200 bits/s ou moins) la parole restituee pr6sente une qualite 
insuffisante et pour pallier cet inconvenient d'autres techniques ont ete 
mises en oeuvre. Une premiere technique est celle du vocodeur 
segmental, dont deux variantes sont celles decrites par MM. B. Mouy ( P. 

30 de la Noue and G. Goudezeune di\& cit6e, et de celle decrite par M. Y. 
Shoham intitulee "Very low complexity interpolative speech coding at 1 .2 
to 2.4 K bps", publie dans IEEE International Conference on Acoustics, 
Speech, and Signal Processing, Munich, April 1997, pp 1599 - 1602. 
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Mais ce jour, aucun' vocodeur segmental n'a <§te juge de 
qualite suffisante pour des applications civiles et commerciales. 

Une deuxieme technique est celle mise en oeuvre dans les 
vocodeurs phonetiques, qui combinent des principes de reconnaissance et 
5 de synthese. L'activite dans ce domaine se situe plutot au stade de la 
recherche fondamentale, les debits vises sont gene>alement tres 
inferieurs a 1 200 bits/s {typiquement 50 a 200 bits/s) mais la qualite 
obtenue est plutdt mauvaise et il n'y a souvent pas de reconnaissance du 
locuteur. Une description de ces types de vocodeurs peut etre trouvee 
10 dans I'article de MM. J. Cernocky, G. Baudoin, G. Chollet, ayant pour 
titre : "Segmental vododer - Going beyond the phonetic approch" publie 
dans I EE International Conference on Acoustics, Speech, and Signal 
Processing, Seattle, May 12-15 T998, pp. 605 - 698. 

Le but de I'invention est de pallier les inconvenients cites. 
A cet effet, I'invention a pour objet un procSde de codage et de 
decodage de la parole pour les communications vocales utilisant un 
vocodeur a tres bas debit comportant une partie analyse pour le codage 
et la transmission des parametres du signal de parole et une partie 
synthese pour la reception et le decodage des parametres transmis et la 
20 reconstruction du signal de parole par utilisation de filtres de synthese a 
prediction lineaire du type consistant a analyser les parametres, decrivant 
le pitch, la frequence de transition de voisement, I'energie, et I'enveloppe 
spectrale du signal de parole, en djcoupant le signal de parole en trames 
successives de longueur determined caracterise en ce qu'il consiste a 
25 regrouper le$ parametres sur N Scarries consecutives pour former une 
super-trame, a effectuer une quantification vectorielle des frequences de 
transition du voisement au coijrs de chaque super-trame, en ne 
transmettant sans degradation que les configurations les plus frequentes 
et en remplacant les configurations les moins frequentes par la 
30 configuration la plus proche en terme d'erreur absolue parmi les plus 
frequentes, a coder |e pitch en ne quantifiant scalairement qu'une seule 
valeur pour chaque super-trame, a coder I'energie en ne selectionnant 
qu'un nombre reduit de valeurs - en regroupant ces valeurs en sous 
paquets quantifies par quantification vectorielle, les valeurs d'^nergie non 
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transmises etant recuperees dans la partie synthese par interpolation ou 
extrapolation a partir des valeurs transmises, a coder par quantification 
vectorielle les parametres d'enveloppe spectrale pour I'encodage des 
filtres de synthese h prediction lineaire en ne selectionnant qu'un nombre 
5 determine de filtres, les parametres non transmis etant reconstruits par 
interpolation ou extrapolation & partir des parametres des filtres transmis. 

D'autres caracteristiques et avantages de Tinvention 
apparaitront a Taide de la description qui suit faite en regard des dossiers 
annexes qui representent : 
10 La figure 1 un module d'excitation mixte d'un vocodeur type 

HSX utilise pour la mise en oeuvre de Tinvention. 

• La figure 2 un schema fonctionnel de la partie "analyse" d'un 
vocodeur de type HSX utilise pour la mise en oeuvre de ('invention. 

La figure 3 un schema fonctionnel de la partie synthese d'un 
15 vocodeur de type HSX utilise pour la mise en oeuvre de ('invention. 

La figure 4 les etapes principales du procede selon ('invention 
mises sous la forme d'un organigramme. 

La figure 5 un tableau montrant la ' repartition des 
configurations des frequences de transition de voisement pour trois 
20 trames consecutives. 

La figure 6 une table de quantification vectorielle des 
frequences de transition de voisement utilisable pour la mise en oeuvre de 
Tinvention. _ 

La figure 7 une liste sous forme de tableau de schemas de 
25 selection et d'interpolatipn mise en oeuvre dans Tinvention pour le 
codage de I'energie du signal de parole. 

La figure 8 une liste sous forme d'un tableau de schemas de 
selection et d'interpolation/extrapolation pour I'encodage des filtres LPC a 
prediction lineaire. 

30 La figure 9 un tableau d'allocation des bits necessaires au 

codage d'un vocodeur de type HSX"a 1 200 bits/s selon Tinvention. 

Le procede selon Tinvention met en oeuvre un vocodeur de 
type connu sous Tabreviation anglo-saxonne HSX de "Harmonic 
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Stochastic Excitation", comme base pour la realisation d'un vocodeur de 
bonne qualite a 1 200 bits/s. 

Une description de ce type de vocodeur peut etre trouvee dans 
('article de MM. C. Laflamme, R. Salami, R. Matmti et J. P. Adoul, ayant 
5 pour titre "Harmonic Stochastic Excitation (HSX) speech coding below 4 
k. bits/s" et publie dans IEEE International Conference on Acoustics, and 
Signal Processing, Atlanta, May 1996, pp.204- 207. 

Le procede selon Hnvention porte sur I'encodage des 
parametres qui permet de reproduce au mieux avec un minimum de debit 

10 toute la complexite du signal de parole. 

Comme schematise a la figure 1 un vocodeur HSX est un 
vocodeur a prediction Iin6aire qui utilise dans sa partie synthese un 
modele d'excitation mixte simple, dans lequel un train d'impulsion 
periodique excite les frequences basses et un niveau de bruit excite les 

15 frequences hautes d'un filtre LPC de synthese. La figure 1 decrit le 
principe de generation de I'excitatlon mixte qui comporte deux voies de 
filtrage. La premiere voie 1i est excitee par un train d'impulsion ? 
periodique effectue un filtrage passe bas et la deuxfeme voie 1 2 excitee 
par un signal de bruit stochastique effectue un filtrage passe haut. La 

20 frequence de coupure ou de transition f c des filtres des deux voies est la 
meme et a une position variable dans le temps. Les filtres des deux voies 
sont complementaires. Un sommateur 2 additionne les signaux fournis 
par les deux voies. Un amplificateur 3 de gain g ajuste le gain de la 
premiere voie de filtrage pour que le signal d'excitation obtenu en sortie 

25 du sommateur 2 soit a spectre plat. 

Un diagramme fonctionnel de la partie analyse du vocodeur est 
repr£sente a la figure 2. Pour effestuer cette analyse le signal de parole 
est d'abord filtre par un filtre passe haut 4 pour etre ensuite segmente en 
trames de 22,5 ms, comportant 180 echantillons preleves a la frequence 

30 8 KHz. Deux analyses par prediction Iin6aire sont effectuees en 5 sur 
chacune des trames. Aux etapes 6 et 7 le signal semi blanchi obtenu est 
filtre en quatre sous bandes. Un suiveur de pitch 8 robuste exploite la 
premiere sous bande. La frequence de transition f c entre ia bande de 
frequence basse des sons voises et la bande de frequence haute des sons 
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non voises est determinee par le taux de voisement mesure en 9 dans les 
quatre sous bandes. Enfin, I'energie est mesuree et codee a I'etape 10 de 
maniere pitch-sychrone, 4 fois par trame. 

Comme les performances du suiveur de pitch et de I'analyseur 
5 de voisement 9 peuvent etre grandement ameliorees lorsque leur decision 
est retarde d'une trame, les parametres resultant, coefficients des filtres 
de synthese, pitch, voisement, frequence de transition et energie sont 
codes avec une trame de retard. 

Dans la partie synthase du vocodeur HSX qui est represents a 
10 la figure 3, le signal d'excitation du filtre de synthese est forme de la 
maniere deja representee k la figure 1 par la somme d'un signal 
harmonique et d'un signal aleatoire dont les enveloppes spectrales sont 
complementaires. La composante harmonique est obtenue en passant un - 
train d'impulsions a la periode pitch dans un filtre passe bande precalcule 
15 1 1 . La composante aleatoire est obtenue a partir d'un genSrateur 12 
combinant une transform^ de Fourier inverse et un recouvrement 
tempore!. Le filtre LPC de synthese 14 est interpole 4 fois par trame. Le 
filtre perceptuel 15 couple en sortie de filtre 14 permet d'obtenir une 
meilleure restitution des caractSristiques nasales du signal de parole 
20 originel. Enfin le dispositif de cohtrole automatique de gain permet 
d'assurer que I'Snergie pitch-synchrone du signal de sortie est egale a 
celle qui a ete transmise. 

Avec un dSbit aussi bas que 1200 bits/s, il n'est pas possible 
d'encoder de facon precise toutes les 22,5 ms les 4 parametres pitch, 
25 frequence de transition de voisement, Snergie et coefficients des deux 
filtres LPC a 10 coefficients par trame. 

Pour exploiter au mieux les caracteristiques temporelles de 
revolution des parametres qui cOTnportent des periodes de stabilite 
entrecoup6es de variations rapides, le precede selon ('invention se 
30 deroule en cinq etapes principales r^ferenc^es de 17 a 21 sur la figure 4. 
L'etape 17 regroupe les trames vocodeurs par N trames pour former une 
super trame. A titre indicatif une valeur de N egale a 3 peut etre choisie 
car elle realise un bon compromis7entre la reduction possible du debit 
binaire et le retard introduit par le proc6de de quantification. D'autre part, 
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elle est compatible avec les techniques d'entrelacement et de codage 
correcteur d'erreurs actuelles. 

La frequence de transition de voisement est codee a I'etape 1 8 
par quantification vectorielle en utilisant uniquennent quatre valeurs de 
5 frequence, 0,750,2000 et 3625 HZ par exemple. Dans ces conditions 6 
bits a raison de 2 bits par trame sont suffisants pour coder chacune des 
frequences et transmettre exactement la configuration de voisement des 
trois trames d'une super trame. Toutefois comme certaines 
configurations de voisement ne se reproduisent que tres rarement, on 

10 peut considerer qu'elles ne sont pas forcement caracteristiques de 
1'evolution du signal de parole normal, car elles ne semblent pas participer 
3 ('intelligibility ni a la qualite de la parole restitute. C'est le cas par 
exemple lorsque une trame est totalement voisee de 0 Hz jusqu'a 
3 625 Hz et qu'elle est comprise entre deux trames totalement non 

15 vois6es. ~ 

Le tableau de la figure 5 retrace une repartition de 
configuration de voisement sur trois trames successives, calculees sur 
une base de donnees de 123 158 trames de parole. Dans ce tableau les 
32 configurations les moins fr6quehtes comptent pour seulement 4% de 

20 toutes les trames, partiellement ou totalement voisees. La degradation 
obtenue en remplapant chacune de ces configurations par la plus proche, 
en terme d'erreur absolue, des 32 configurations les plus representees 
est imperceptible. Ceci montre qu'il est possible d'economiser un bit en 
quantifiant vectoriellement la frequence de transition de voisement sur 

25 une super trame. Une quantification vectorielle des configurations de 
voisement est montree dans le taBIeau reference 22 sur la figure 6. Le 
tableau 22 est organist de sorte que I'erreur quadratique moyenne 
produite par une erreur sur un bit d T adressage soit minimale. 

Le codage du pitch s'exicute a I'etape 19. II met en oeuvre un 

30 quantificateur scalaire sur 6 bits, avec une plage d'echantillons de 16 a 
148, et un pas de quantification uniforme sur une echelle logarithmique. 
Une seule valeur est transmise pour trois trames consecutives! Le calcul 
de la valeur a quantifier a partir des trois valeurs de pitch et la procedure 
permettant de recuperer les trois valeurs de pitch a partir de la valeur 
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quantise, different selon la valeur des frequences de transition de 
voisement de I'analyse. Le processus est le suivant: 

1 . Lorsque aucune trame n'est voisee, les 6 bits sont 
positionnes h z§ro, le pitch d£codd~est fixe a une valeur arbitraire soit, par 

5 exemple, a 45 echantillons pour chacune des trames de la super trame. 

2. Lorsque la derniere trame de la super-trame precedente et 
les trois trames de la super trame courante sont vois^es, c'est a dire, 
lorsque la frequence de transition de voisement est superieure strictement 
a zero, la valeur quantifiee est la valeur du pitch de la. derniere trame de la 

10 super trame courante qui est alors consideree comme une valeur cible. 
Au'decodeur la valeur decodee du pitch pour la troisieme trame de la 
super-trame courante est la valeur cible quantifiee, et les valeurs du pitch 
decodes pour les deux premieres trames de la super-trame courante sont 
recuperees par interpolation Iin6aire entre la valeur transmise pour la 

15 super-trame pr6c6dente et la valeur cible quantifiee. 

3. Pour toutes les autres configurations de voisement, c'est la 
valeur ponderee du pitch sur les trois trames de la super-trame courante 
qui est quantifiee. Le facteur de ponderation est proportionnel a la 
frequence de transition de voisement pour la trame consideree suivant la 

20 relation : 

Pitch(i)* voisement(i) 

Valeur Moyenne Pondir6e - i = 

2, voisement(i) 

i = l-3 

Au d6codeur la valeur du pitch decodee pour les trois trames 
de la super-trame courante est 6gale a la valeur moyenne ponderee 
quantifi6e. 

25 De plus dans les cas 2 et 3, un leger tremolo est applique 

systematiquement aux valeurs du" pitch utilis^es en synthese pour les 
trames 1 , 2 et 3 pour ameliorer le naturel de la parole restituee en evitant 
la generation de signaux trop forfement periodiques, suivant par exemple 
les relations : 

30 Pitch utilise (1) = 0,995.* Pitch Decode (1) 

Pitch utilise (2) = 1,005 * Pitch Decode (2) 
Pitch utilise (3) = 1,000';* Pitch Decode (3) 
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L'interet de proceder h une quantification scalaire des valeurs 
de pitch est qu'il limite le probleme de propagation des erreurs sur le train 
binaire. De plus les schemas de codage 2 et 3 sont suffisamment proches 
Tun de I'autre pour etre insensibles aux mauvais decodages de la 
5 frequence de voisement. 

L'encodage de I'energie"~"est effectue a I'eta'pe 20. II a lieu de la 
facon representee dans le tableau reference 23 sur la figure 7 en utilisant 
une methode de quantification vectorielle du type de ce|Ie decrite dans 
Tarticle de RM Gray, ayant pour tftre "Vector Quantization" , publie dans 

10 la revue IEEE ASP Magazine, vol. 1, pp 4-29, avril 1984. Douze valeurs 
d'energie num^rotees de 0 k 11 sont calculees a chaque super-trame par 
la partie analyse et seulement six valeurs d'energie parmi les douze sont 
transmises. Ceci conduit a construire deux vecteurs de trois valeurs par la 
partie analyse. Chaque vecteur est quantifie sur six bits. Deux bits sont 

15 utilises pour transmettre le num6ro de schema de selection utilise. Lors 
du decodage dans la partie synthase, les valeurs de Tenergie qui n'ont 
pas ete quantifiees sont r6cup6r6es par interpolation, 

Seuls quatre schemas de selection sont autorises comme te 
montre le tableau de la figure 7. Ces schemas sont optimises afin 

20 d'encoder au mieux, soit les vecteurs de 12 energies stables, soit ceux 
pour lesquels l'6nergie varie rapidement au cours des trames 1, 2, et 3. 
Dans la partie analyse le vecteur d'energie est encode selon chacun des 
quatre schemas, et le schema effectivement transmis est celui qui 
minimise Terreur quadratique totale. 

25 Dans ce processus les "bits donnant le numdro du schema 

transmis ne sont pas considers comme sensibles, puisque qu'une erreur 
sur leur valeur ne fait qu'alterer legerement revolution temporelle de la 
valeur de I'energie. De plus la table de quantification vectorielle des 
energies est organisee pour que I'erreur quadratique moyenne produite 

30 par une erreur sur un bit d'adressage soit minimale. 

Le codage des coefficients modelisant Tenveloppe du signal de 
parole a lieu par quantification vectorielle a I'etape 21. Ce codage permet 
de determiner les coefficients des filtres numeriques utilises dans la partie 
synthese. Six filtres LPC a 10 coefficients numerotes de 0 a 5 sont 
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calcules a chaque super-trame par la partie analyse et seulement 3 filtres 
parmi les 6 sont transmis. Les six vecteurs sont transformes en six 
vecteurs de 10 paires de raies spectrales LSF suivant par exemple le 
processus decrit dans Particle de M F. ITAKURA, intitule "Line Spectrum 
5 Representation of Linear Predicti ve C oefficients" et publie dans le Journal 
Acoustique Sociaty America, vol.57, P.S35, 1975. Les paires de raies 
spectrales sont encodee par une technique similaire a celle mise en 
oeuvre pour le codage de I'energie. Le processus consiste a selectionner 
trois : filtres LPC, et & quantifier chacun des vecteurs sur 18 bits en 
10 utilisant par exemple un quantificateur vectoriel predictif en boucle 
buverte, avec un coefficient de prediction 6gal a 0,6, de type SPLIT -VQ 
portant sur deux sous-paquets de 5 LSF consecutives auxquels il est 
. alloue a chacun 9 bits. Deux bits sont utilises pour transmettre le num£ro 
du schema de selection utilise. Au niveau du decodeur lorsqu'un filtre 
15 LPC n'est pas quantifie, sa valeur est estimee a partir de celle des filtres 
LPC quantifies par interpolation lineaire par exemple, ou par extrapolation 
par duplication par exemple du filtre LPC precedent. A titre d'exemple un 
processus de quantification vectdrielle par paquets pourra etre constitue 
de la fa<pon decrite dans ('article de MM K.K. PALIWAL, BS. ATAL, ayant 
20 pour titre "Efficient Vector Quantization of LPC Parameters at 24 
bits/frame" et publie dans IEEE transaction on Speech and Audio 
Processing, Vol. 1 , Janvier 1993. 

Comme indique dans le tableau reference 24 sur la figure 8, 
seuls quatre schemas de selection sont autorises. Ces schemas 
25 permettent de coder au mieux, soit les zones pour lesquelles I'enveloppe 
spectrale est stable, soit les zones pour lesquelles I'enveloppe spectrale 
varie rapidement au cours des trames 1, 2, ou 3. L'ensemble des filtres 
. LPC est alors code selon chacun des quatre schemas, et le schema 
effectivement transmis est celui quhninimise I'erreur quadratique totale. 
30 De maniere similaire au "codage de l'6nergie/ les bits donnant le 

numero du schema ne sont pas a considerer .comme sensibles, puisque 
une erreur sur leur valeur ne Jait qu'alterer legerement revolution 
temporeile des filtres LPC. De plus les tables de quantification vectorielle 
des LSF sont organisees dans la partie synthese de sorte que I'erreur 
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quadratique moyenne produite par une erreur sur un bit d'adressage soit 
minimum. 

[.'allocation des bits pour la transmission des parametres LSF, 
de I'energie, du pitch et du voisement qui resulte de la methode de 
5 codage mise en oeuvre par I'invention est representee dans le tableau de 
la figure 9 dans le cadre d'un vocodeur a 1200 bits/s dans lequel les 
parametres sont cod£s toutes les 67,5 ms; 81 bits etant disponibles a 
chaque super trame pour encoder les parametres du signal. Ces 81 bits 
se decomposent en 54 bits LSF, 2 bits pour la decimation du schema des 
10 LSF, 2 fois 6 bits pour r6nergie,~8 bits pour le pitch et 5 bits pour le 
voisement. 
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REVENDICATIONS 

1 . Procede de codage et de decodage de la parole pour les 
5 communications vocales utilisant un vocodeur a tres bas debit 

comportant une partie analyse (4,.... 10) pour le codage et la transmission 
des parametres du signal de parole et une partie synthese (1 1 , — 16) pour 
la reception et le decodage des parametres transmis et la reconstruction 
du signal de parole par utilisation de filtres de synthese a prediction 

10 lineaire du type consistant a analyser les parametres, decrivant le pitch 
(8), la frequence de transition de voisement (9), I'energie (10), et 
I'enveloppe spectrale (5) du signal" de parole, en decoupant le. signal de 
parole en trames successives- de longueur determinee caract6ris6 en ce 
qu'il consiste a regrouper (17) les parametres sur N trames consecutives 

15 pour former une super-trame, & effectuer une quantification vectorielle 
(18) des frequences de transition du voisement au cours de chaque 
super-trame, en ne transmettant sans degradation que les configurations 
les plus frequentes et en remplacant les configurations les moins 
frequentes par la configuration la plus proche en terme d'erreur absolue 

20 parmi les plus frequentes, & coder le pitch (19) en ne quantifiant 
scalairement qu'une seule valeur du pitch pour chaque super-trame, a 
coder I'energie (20) en ne s6lectlpnnant qu'un nombre reduit de valeurs 
en regroupant ces valeurs en sous paquets quantifies par quantification 
vectorielle, les valeurs d'energie non transmises etant recuperees dans la 

25 partie synthese par interpolation ~ou extrapolation a partir des valeurs 
transmises, a coder par quantification vectorielle (21) les parametres 
d'enveloppe spectrale pour I'encodage des filtres de synthese a prediction 
lineaire en ne s6lectionnant qu'un nombre determine de filtres, les 
parametres non transmis etant reconstruits par interpolation ou 

30 extrapolation a partir des parametres des filtres transmis. 

2. Procede selon la revindication 1 caracteris^ en ce que la 
valeur quantifiee du pitch est soit la derniere valeur du pitch des zones 
stables entierement voisees, soit une valeur moyenne ponderee par la 
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frequence de transition de voisement dans les zones qui ne sont pas 
entierement voisees. 

3. Procede selon la revendication 2 caracterise en ce qu'il 
consiste lorsque la valeur de pitch est la derniere d'une super-trame, a 

5 reconstituer les autres valeurs par interpolation. 

4. Procede selon la revendication 3 caracterise en ce que la 
valeur du pitch utilisee dans la partie synthese est celle du pitch decode 
modifie par un coefficient de multiplication pour produire un leger tremolo 
dans la parole reconstitute. 

10 5. Procede selon Tune quelconque des revendications 1 a 4 

caracterise en ce que les parametres sont regroupts sur un nombre N = 3 
de trames consScutives. 

6. Proctde selon la revendication 5 caracterise en ce que les* 
frequences de voisement sont au nombre de 4 et sont codees 

15. vectoriellement a Taide d'une table de quantification (22) comportant 32 
configurations de frequences groupies par 3. 

7. Procede selon Tune quelconque des revendications 5 et 6 
caracterise en ce qu'il consiste h mesurer I'energie 4 fois par trame, 
seulement 6 valeurs parmi les 12 d'une super-trame etant transmises 

20 (23) sous la forme de deux vecteurs de 3 valeurs. 

8. Procede selon la revendication 7 caracterise en ce qu'il 
consiste a coder I'energie (23) suivant quatre schemas regroupant chacun 
deux vecteurs, un premier schema lorsque les douze vecteurs d'energie 
dans la super-trame sont stables, les schemas restants etant definis pour 

25 chacune des trames, et a transmettre le schema qui minimise Terreur 
quadratique totale. 

9. Procede selon la revendication 8 caracterise en ce que : 

- dans le premier schema seules les valeurs d'energie 
numerotees 1 , 3, et 5 du premier "vecteur et celles numerotees 7, 9, 11 

30 du deuxieme vecteur sont transmises, 

- dans le deuxieme schema seules les valeurs d'energies 
numerotees 0, 1, et 2 du premier vecteur et celles numerotees 3, 7, et 
1 1 du deuxieme vecteur sont transmises, 
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- dans le troisieme schema seules les valeurs d'energies 
numerotees 1, 4 5 du premier vecteur et celles numerotees 6, 7, et 1 1 
du deuxieme vecteur sont transmises, 

- et dans le quatridme schema seules les valeurs d'energies 
5 numerotees 2, 5 et 8 du premier vecteur et celles numerotees 9, 10 et 

1 1 du deuxieme vecteur sont transmises. 

10. Proc^de selon l'urie~quelconque des revendications 1 a 9 
caracterise en.ce qu'il consiste a effectuer la selection des parametres 
d'encodage des filtres de prediction lineaire suivant quatre schemas pour 

10 encoder au mieux soit les zones pour lesquelles I'enveloppe spectrale est 
stable, soit les zones pour lesquelles I'enveloppe spectrale varie 
rapidement au cours des trames 1, 2, ou 3 d'une super trame. 

11. Proc6de selon la revendication 10 caract6ris6 en ce qu'il 
consiste a utiliser (24) dans la partie synthese 6 filtres & prediction 

15 lineaire a 10 coefficients numerates de 0 a 5 et a transmettre : 

- dans un premier schema que les coefficients des filtres 1 , 3, 
et 5 lorsque I'enveloppe spectrale est stable, 

- dans un deuxieme schema correspondant a fa premiere trame 
que les coefficients des filtres 0, 1 et 4, 

20 - dans un troisi&me schema correspondant a la deuxieme trame 

que les coefficients des filtres 2, 3 et 5, 

- dans un quatrieme schema correspondant a la troisieme trame 
que les coefficients des filtres 1, 4 et 5, 

le schema effectivement transmis etant celui qui minimise 
25 I'erreur quadratique totale; les coefficients des filtres non transmis etant 
calcules dans la partie synthese par interpolation ou extrapolation. 

12. Procede selon Tune quelconque des revendications 1 a 11 
caracterise en ce que les coefficients LSF des filtres de synthese sont 
codes sur un nombre de 54 bits auquel est ajoute deux bits pour la 

30 transmission des schemas de decimation, I'energie est codee avec un 
nombre de 2 fois 6 bits auquel est ajoute 2 bits pour la transmission des 
schemas de decimation, le pitch est code sur un nombre de 6 bits et la 
frequence de transition de voisement est codee sur un nombre de 5 bits 
soit au total 81 bits pour des super-trames de 67,5 ms. 
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